心智计算的先驱——赫伯特•西蒙
点击上方“脑人言”可以订阅哦
撰文 | 呵呵Whatever
编辑 | X君
1978年,赫伯特·西蒙(Herbert A.Simon, 1916—2001)因为“有限理性说”和“决策理论”获得诺贝尔经济学奖。
图1 赫伯特·西蒙
瑞典科学皇家学院总结认为:
“就经济学最广泛的意义上来说,西蒙首先是一名经济学家,他的名字主要是与经济组织中的结构和决策这一相当新的经济研究领域联系在一起的。”
等等,我们不是Neuroscience专辑吗?为什么要介绍一位经济学奖获得者?
西蒙当然不单单是一个经济学家。以当代人的眼光来看,赫伯特·西蒙在“人工智能”、“信息处理”、“决策理论”、“问题解决技术”、“组织理论”、“复杂系统”这些领域中都做出过先驱性的贡献。虽然赫伯特·西蒙的贡献没有直接涉及到神经科学,但作为心智计算的先驱,介绍他的工作还是有利于我们了解目前的认知科学、人工智能、计算模拟等等学科流派是怎么来的。
从《数学原理》谈起
近代的人工智能起源于几个世纪以来人们对于数学的“通用化语言”做出的探索。
大约一百多年前,20多岁的德国数学家、逻辑学家弗雷格发明了现代逻辑系统,这套被称为“谓词逻辑”的系统是当代基础数学、计算机科学、人工智能科学的最基本的语言。
几十年后,罗素和怀特海所著的《数学原理》已经将几乎所有的数学体系统一到一个“谓词逻辑”系统中了。整本书浸透了一种强烈依赖逻辑,而不依赖直觉的思维模式。这种思维模式在后世遭到了批判,比如说“1+1=2”这种生活中近乎直觉的思维结果,在《数学原理》中用了几十页才证毕。
图2 《数学原理》对自然数“1”证明
20世纪2、30年代,一部分逻辑学家开始探讨机器证明这个问题,通俗讲,就是用机器证明数学定理。这些逻辑学家的目标就是找到一个判定逻辑真假的通用法则。这个通用法则一旦被找到,它就可以在被编程,由机器来执行,以判断数学命题。
后来,通用的法则被证明是可行的,Church消解定理被发现了。用机器(物理符号系统)证明数学定理就有了最基本的理论支持。后来的最广通代、m.g.u方法、Skolem范式都是基于此进行的。很多“泡面番”之类的文章将这些前人的工作几乎全部默认到了赫伯特·西蒙身上,仿佛他一夜之间就想出了机器证明的方法。
不过,平心而论,这些学者做的工作仅仅是在理论上证明可行性,那么数学课本上的定理真的可以被机器证明吗?给出答案的正是赫伯特·西蒙和他的合作者。
物理符号系统假设
1956年夏举行的达特茅斯研讨会被后人公认为AI科学的肇端。会议的参与者里有两个耳熟能详的名字:香农(Shannon)皮茨(Pitts)。他们分别是计算机科学和人工神经网络学科的鼻祖中的鼻祖。
然而这两位只是负责围观的。不过大师就是大师,皮茨对于会议有很深入的总结,他敏锐地发现,这次研讨会出现了“两条路线”,一条是通过模拟人们的“里”(神经元活动方式)来达到模式识别,另外一条是通过模拟人们的“表”(思维活动方式)以让机器活动。然而这两条路线都没有拿出能够工作的“真家伙”来。前者只讲了一篇模式识别的文章,后者连文章都没有,以“空手接白刃”的精神讲怎么用计算机下棋。
然而皮茨没有察觉到的“第三条路线”却拿出了可以运行的“人工智能”。这个在当时唯一一个可用的人工智能程序就是西蒙和纽厄尔(A. Newell)的“逻辑理论家”( Logic Theorist)。它能够证明《数学原理》一书中的“谓词演算”的38个定理(书中所有的“谓词演算”的350个定理全部被证明的工作由华人数学家王浩完成)。
“逻辑理论家”程序是在西蒙和同事一起开发的IPL(Information Processing Language)上编写和运行的,这是世界上第一个专门为人工智能开发设计的语言,也是第一个基于列表(List)的计算机语言。这一点弥足珍贵,要知道,IPL以前,计算机语言还仅仅是依附于“冯诺依曼结构”的编译和控制系统,而IPL使得计算机系统能够不受硬件限制,运行任何一种对应用来说是恰当的数据类型。
图3 最早于1957年运行FORTRAN编译器的IBM704型号计算机
有趣的是,西蒙在设计该语言的时候,用的是“人肉寄存器”——他让孩子们拿着牌子围绕周围,自己则在牌子上写变量。IPL语言一共有六个版本,发布了五代。基于IPL语言环境的人工智能程序还包括“通用问题求解”和“Compute Chess”。西蒙等人在“Compute Chess”的基础上,对于计算机如何通过“视觉”理解棋局和采用“复杂问题解决系统”下棋进行了一系列研究。
达特茅斯研讨会的另外一个巨头,麦卡锡和他的学生在IPL的基础上制作了LISP系统,至今为止仍然是较为流行的人工智能设计语言。这个系统和IBM合作后,“Computer Chess”项目的接力棒也转移到了IBM手中,这个项目最广为人知的事迹的是90年代“深蓝”击败世界冠军。几十年后,既模仿人类神经活动的“里”(卷积神经网络),又模仿人类思维决策的“表”(决策树)的产品——Alphago在它的围棋王国里已经站到了俾睨众生的地步。
图4 依靠“卷积神经网络”和“决策树”击败各路围棋冠军的Alphago
让我们回到达特茅斯研讨会上来,发布“逻辑理论家”的两个人其实是师徒关系,纽厄尔是西蒙的学生,但西蒙在任何场合都将纽厄尔的名字放到自己前面。这对师徒提出的“第三条路线”即“物理符号系统假说”(physical symbol system hypothesis)。
实际上,我们从《数学原理》开始梳理至今,已经把“物理符号系统假说”的部分发展轨迹交代了。西蒙认为“物理符号系统假说”的发展经历了“形式逻辑”、“图灵机”、“冯诺依曼结构”、“表处理”和“计算机语言”阶段。这也是西蒙对于人工智能提出的第三条路线。这个路线是和数学逻辑符号化的发展潮流下产生的,它的每一步进展也都不乏逻辑证明。这和“神经网络”的“黑箱子”的形象形成了鲜明对照。
有限理性批判
显然,沿着“物理符号系统假说”往下发展,人们最终发明的是“计算机语言”。这就好像在乔布斯发布苹果“智能手机”时,只是发布了一个可以运行计算机语言系统的移动终端,手机并不会因为被冠名“智能”两个字就比“塞班系统”多出来任何关于“智能”的东西。虽然难以科学定义,人们还是一眼能够看出,当今的计算机系统和生物的智能依然相去甚远。
在当年,人工智能的目标还不是超越人类,而是模仿人类。显然西蒙的基于物理符号机器必然要遇到人类的“有限理性”问题。在设计“通用问题求解”程序时,西蒙把人比喻为在问题空间展开搜索的完全理性的机器,这显然与事实不符。人们表现出来的行为,并不是“弗洛伊德式”的潜意识控制下的模式,也不像超级理性的机器。
在特德蒋的小说里,男主在注射了荷尔蒙K药物后,神经突触开始增多导致智力骤然上升(这当然是小说家言),在最初的阶段里,“我”是这么感受的:
我的意识大耗大脑资源。头脑有限的容量和生理结构只能勉强支撑这种对自我无所不知的意识。不过,这种意识也可以作出一定程度的自我调节,我让我的意识充分利用现有的资源,不要超越这一范围。这很困难:我仿佛局处笼中,既坐不下去,也站不起来。一旦要松弛或者伸直身体,接踵而来的便是剧痛、疯狂。
——特德蒋《领悟》
正如书中所言,西蒙意识到,首先,外在环境并不能完全映射到人的心理空间中,存在信息不对称;其次,人的能量和时间是有限的,不可能投入无限的资源去遍历问题空间。这在西蒙设计的心理学实验中得到了验证。
然而作为一个提出并深信“物理符号系统假说”的人,西蒙并没有从而否定“形式逻辑”模拟认知的可能性。他用符号逻辑来构建和模拟这个“有限理性”。在西蒙阐述“有限理性”的论文当中,他仍然用数学逻辑来模拟“觅食系统”,在这个系统中,个体要想生存下去,就必须在能量和时间耗尽之前对这个不确定性的世界做出决策。想遍历问题空间的完全理性并不能适应环境。而进行“满足即可”的局部最优决策则有更大的概率活下去。
显然,这个理论在当时最佳的应用场景是经济学。
反思和评价
西蒙总结的“物理符号系统假说”的发展趋势,看起来更像是计算机的发展史。而当今计算机和人类思维的差别已经显而易见,甚至贸然讨论这两者的联系都会被视为不严谨。而他构建有限理性模型时用到的对于不确定性和自身资源的超然视角,也受到了比较广泛的批判。
然而这些批判并不能掩盖西蒙在人工智能、认知科学和经济学上产生的巨大影响。“物理符号系统假说”的这一路线的发展也是真实可靠的。在意识到联结主义、认知神经科学暂时还无法对于意识、思维等问题进行解构后,讨论这类问题时,最严谨的文献中依然采用人类意识、认知是“物理符号系统”的这一假说。
实际上,计算机语言本身就是数学这一“形式逻辑”的应用方向之一,在这个“成果转化”的过程中,赫伯特·西蒙做出了无人能够取代的贡献。西蒙的贡献在于各个领域,然而他的思路确实是一以贯之、稳步向前的。或许我们这一代人在没有看到更大的图景之前,就攻击前人的开创性成果可能并不是那么理智。
我们毋宁相信,西蒙获得诺贝尔经济学奖只是因为诺贝尔奖项中没有心理学奖和计算机科学奖。毕竟这位在各个领域都可以算是开山鼻祖式的人物曾经获得过这两个学科的世界最高奖项。我更喜欢1975年图灵奖对于他的概括:“对人工智能、认知心理学和表处理做出的基础性工作。”
在各个学科、不同领域之间的鸿沟持续增大,而科研活动越来越需要不同领域相互合作的如今,我们应当学习赫伯特·西蒙的精神,对于各个领域都有一些起码的学科素质,这样才能在合作中找对方向和对象。
题图为赫伯特·西蒙访问中科院心理所。
参考文献:
马希文著, & 马希文. (2003). 逻辑·语言·计算:马希文文选. 商务印书馆.
维基百科.
Simon, H. A. (1955). A behavioral model of rational choice. The quarterly journal of economics, 69(1), 99-118.
Newell, A., & Simon, H. (1956). The logic theory machine--A complex information processing system. IRE Transactions on information theory, 2(3), 61-79.
Simon, H. A. (1956). Rational choice and the structure of the environment. Psychological review, 63(2), 129.
Newell, A., Shaw, J. C., & Simon, H. A. (1958). Chess-playing programs and the problem of complexity. IBM Journal of Research and Development, 2(4), 320-335.
Simon, H. A. (1972). Theories of bounded rationality. Decision & Organization, 161-176.
Chase, W. G., & Simon, H. A. (1973). The mind's eye in chess.
Newell, A., & Simon, H. A. (1976). Computer science as empirical inquiry: Symbols and search. Communications of the ACM, 19(3), 113-126.
Simon, H., & Chase, W. (1988). Skill in chess. In Computer chess compendium (pp. 175-188). Springer New York.
Gobet, F., & Simon, H. A. (1996). Templates in chess memory: A mechanism for recalling several boards. Cognitive psychology, 31(1), 1-40.
新浪微博:脑人言
知乎专栏:行为与认知神经科学
QQ群:638710880
脑人言 | 聊聊脑科学
长按二维码关注我们
~友情赞助~